背景介绍
SENet:是2017年发表在CVPR上的一个模型,也是最后一届ImageNet 2017竞赛分类任务的冠军,其创新点是引入了注意力Squeeze-and-Excitation (SE)模块。
SENet特点
引入了注意力Squeeze-and-Excitation(SE)模块
由于SE模块简单有效,因此可以很容易的和其他模型耦合,和ResNet耦合变成SE-ResNet,和Inception-V3耦合变成SE-Inception-V3等等
Squeeze-and-Excitation
Squeeze-and-Excitation:又称为特征重标定卷积,或者注意力机制。具体来说,就是通过学习的方式来自动获取到每个特征通道的重要程度,然后依照这个重要程度去提升有用的特征并抑制对当前任务用处不大的特征。
首先是 Squeeze操作,先进行全局池化,具有全局的感受野,并且输出的维度和输入的特征通道数相匹配,它表征着在特征通道上响应的全局分布。
然后是Excitation操作,通过全连接层为每个特征通道生成权重,建立通道间的相关性,输出的权重看做是进过特征选择后的每个特征通道的重要性,然后通过乘法逐通道加权到先前的特征上,完成在通道维度上的对原始特征的重标定。
SE-ResNet50图像分析
TensorFlow2.0实现
1 | from functools import reduce |
SENet小结
SENet是一种非常好的思路,其模型参数需要根据选择的耦合模型确定,如果耦合模型为SE-ResNet50,则参数量为28M,其注意力机制非常有效,为MobileNet-V3的发展,EfficientNet,GhostNet等网络起到了推动作用。